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ÜBER DIE VERTEILUNG DER SEMANTISCHEN INFORMATION IN LEHRPRO=- 
GRAMMTEXTEN 


von Herbert Anschiitz, Heidelberg 


l. Das (m,i)-Diagramm 


Wenn man die Lehrbegriffe eines Lehrprogrammtextes in der Reihenfolge ihres 
Auftretens numeriert und diese Begriffsnummern m über den :Framenummern 
i aufträgt, so erhält man ein Diagramm, welches den Begriffsfortschritt des Ler- 
nens mitdem Framefortschritt zeigt. Bei den meisten untersuchten Programmen 
ergab sich, daß der mittlere Begriffsfortschritt/Frame eine Konstante v über das 
ganze Programm hin war, d.h. die Anzahl m der gebrachten Begriffe ist eine 
recht genaue lineare Funktion der Framezahl i; 


m = 2’"+ Vi „ 
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Bild 1: (m,i)-Diagramm 





Der Autor verwendet hier zur Abkürzung die aus dem angelsächsischen Schrift= 


tum übernommene Terminologie, d. h. "Frame" statt "Inhaltseinheit" bzw. 
"Lebrschritt", 











Dabei ist 2” eine Konstante, die die Dimension einer Anzahl von Begriffen/Frame 
hat, v ist der mittlere Begriffsfortschritt/Frame, 


Wenn man nun nicht annehmen will, daß die Begriffszahl/Frame immer größer 
wird, (d.h, die Frames immer länger), so muß es eine zweite Begrenzung des 
markierten Feldes, d,h, einm, geben, fürdasfür iya der Begriff m<my nicht: 
mehr genannt wird (weil er dann eingeprägt ist oder ein neuer Oberbegriff er- 
arbeitet wurde), Das markierte Feld legt zwischen zwei parallelen Geraden 
m=z’+viundm, =z" + vi, Dabei ist 2" ebenfalls eine Begriffszahl, z = 2° + 
z" ist die Anzahl der Begriffe, die zwischen der Vorderkante m und der Hinter- 
kante Mm, des Erwähnungsfeldes liegen, 


mem =z°+2"=z 
h 
Ein Punkt (m, i)stellteineErwähnungdesm-tenBegriffes imi-ten Frame dar. 
Die beschriebene Darstellung des Programminhaltes nennen wir das (m,i)*- 
Diagramm des Lehrprogrammes, 


Bild2 Erwähnung, Begriffsvorgriff und Begriffsrückgriff 
im (m, i)-Diagramm 








2. Die relative mittlere Begriffsredundanz 


Alle Erwähnungen eines Begriffs m liegen auf einer Parallele zur i-Achse und 
stellen Repetitionen des Begriffes dar, Vom Frame i bis zum Frame k wird 
der Begriff immer wieder repetiert, d.h, redundant erwähnt, Dabei werden Ur- 
teile zu den Begriffen gebildet, die in den Feldern A und B erwähnt sind. Wenn 


m 





Bild 3  Begriffszahl z und Repetitionszahl r im (m, i)-Diagramm 


ein Frame präsentiert wird, wird jeweils der gesamte Begriffsinhalt einer senk- 
rechten Schnittlinie durch das Markierungsfeld ins Bewußtsein aufgenommen, 
Das sind jeweils z Begriffe, Von diesen Begriffen werden v zum ersten Male er- 
wähnt, z - v werden redundant erwähnt, sind also schon einmal vorgekommen, 


Die relative Redundanz der im Frame erwähnten Begriffe ist also 
_Z-V 
5777 

Dabei hebt sich der mittlere Informationsgehalt der Begriffe fort, so daß diese 
Zahl die gleiche ist, die man auch durch Ermittlung des Informationsgehaltes 
in bit errechnen könnte, ß = v/z ist die relative Negentropie, d.h. der mittlere 
bezogene Informationsgehalt des Frames.Es gilt wie üblich: ß + 9 =1. ß könnte 
auchalsder Neuigkeitswert des Frames bezeichnet werden, Die beiden Flächen- 
anteile A undBvonFig, 3. haben zusammen die Größe A + B=rz, r ist die Zahl 
der Frames, in denen ein Begriff erwähnt wird, d.h, also v = z/r. z ist die Zahl 
der Begriffserwähnungen in einem Frame, d.h, die Zahl der verschiedenen er= 
wähnten Begriffe, (Wenn ein Begriff im Frame mehrmals erwähnt ist, so gerät 
esdoch im semantischen Zusammenhang nur einmal ins Bewußtsein. Mehrfache 





Erwähnung einer Begriffsbenennung im Frame oder Erwähnungen durch Relativ» 
oder Reflexivpronomina sind syntaktische Mittel der Sprache, wenn ein Frame 
regelrecht strukturiert ist, d.h, eine Sinneinheit bildet. Eine Begriffserwähnung 
wird deswegenin einem Frame nureinmal gezählt,) Die Dimension von z ist also 


[z]= Begriffserwähnungen/Frame . 
Die Dimension von rz ist damit 
[rz]= Begriffserwähnungen . 


Ein Begriff wird mit rz anderen Begriffen zusammengebracht und selbst r mal 
wiederholt, Dadurch werden für jeden Begriff eine Anzahl u « rz logisch defi» 
nitorische Urteile mitgeteilt, Aus ß = v/z und v = z/r folgtr =1/ß, d.h, es gilt 
der Satz; 


Die mittlere reziproke relative Negentropie eines 
Frames ist gleich der mittleren Anzahl der Repe - 
titionen eines Begriffs, 


3. Bemessung von Programmlängen 


Wennein Lehrstoff, der aus M Begriffen besteht, in I Frames gelehrt wird, so er= 
gibt sich bei gleichmäßigem Fortschreiten ein Begriffsfortschritr, 


M 
Ikso Begriffe/Frame . 


| 


Leserichtung 








Die vordere Grenze des Erwähnungsfeldes ist damit gegeben durch 


z” nennen wir den mittleren Begriffsvorgriff, Die hintere Grenze des Er“ 
wähnungsfeldes ist 


m MA i-z" mit dem Begriffsrückgriff z", 


Alle Erwähnungen der Begriffe des Lehrstoffes (Lehrbegriffe) liegen in dem Sechs- 
eck (0, R", Z", P,R’, z’) 


Wegen v = z/r ist die Anzahl I der für M benötigten Frames 
= M/v =M ı/z 


Wenn man in diese Gleichung 


~~ 
einführt, erhält man 


ku No 
also) ' 
Das ist die Anzahl der Frames einer durch z und $ gekennzeichneten Art, mit 
der ein Lehrstoff M behandelt werden muß, Nun darf die Begriffszahl z eines 
Frames einen gewissen Wert Zo nicht überschreiten, weil die Kapazität des Ge= 
genwartsspeichers (Bewußtsein) mit K, = 160 bit beschränkt ist. Wenn H der In- 
formationsgehaltin bit/Begriff ist, so ist Hz_ = Ki bit, Aus der Forderung z £ Zu 
ergibt sich also 

M z Kk 

— = AN I“ 

EIN DEN) 


(Ki nach H. Frank, 1960). 


Man darf also den Be griffsfortschritt nicht über einen gewissen Maximalwert stei- 
gern, wenn die Kapazität des Bewußtseins nicht überschritten werden soll, Je 
größer © ist, umso kleiner muß v sein, Für I gilt: 

MH M 


ME == ——=— e ZE = mr 
K (1-8) 2 (19) 





Ein Programm für M Lehrschritte muß also eine Mindestzahl 


— u u RER. SUKO 
BER lee) z, (19) 


Frames haben, 


4. Der Abbau der semantischen Information der Begriffe 


Wenn ein Begriff im Mittel die semantische Nachrichtenmenge H bit enthält, 
so ist bei der erstmaligen Erwähnung dieser Wert als subjektive Information des 
Begriffes anzusprechen, Bei jeder Erwähnung des Begriffes wird nun im Mit- 
tel der subjektive Informationsgehalt des Begriffes um die (einstweilen 
unbekannte) Größe k sinken, Der Lernfortschritt (im Sinne der von Cube“ schen 
Redundanztheorie des Lernens (1963)) ist also pro Frame AR=2,k, Die Zahl 
r der Wiederholung muß also mindestens so groß sein, dßr 4, R = rzk = H ist, 
Es ist also 

r= H/k.z , 
wenn der Begriff vollkommen gelernt worden ist. Das entspricht der These von 
Ludwig (1965), daß die Zahl der Repetitionen eines Begriffes ein Maß für seinen 
semantischen Informationsgehalt ist. Programme mit verschiedenen z dürfen je~ 
doch wegen der Abhängigkeit der Größe r von z nicht mit der gleichen Repe= 
titionszahl r der Begriffe aufgebaut werden, Hier muß zum Vergleich der Schwie- 
tigkeit der Begriffe die Größe rz = H/k herangezogen werden, die wie in Ab- 
schnitt 2 gezeigt wurde, gleich der Zahl derjenigen Begriffe ist, die mit dem 
Lehrbegriff zusammen erwähnt werden, d.h, aber im wesentlichen mit 
der Zahlder Begriffe, die ihn logisch definieren, In verschiedenen Programmen 
muß rz eine Konstante -ein Sollwert -sein, der nur von psychologischen Daten 
der Adressaten und vom mittleren Informationsgehalt H abhängt, 


Wenn in einem Programm rz > Cu ist, dann hat der Autor H zu groß einge- 
schätzt, 


Ist rz < = „ so hat er H zu klein eingeschätzt und der Informationsgeha lt wird 


nicht vollständig abgebaut, der Lehreffekt ist schlecht, während bei rz > H/k 
das Programm langweilig ist, weil der Schüler Tatsachen erneut erfährt, die er 
schon weiß, 


Nunist bedauerlicherweise H/k nicht bekannt, und es sind auch keine Möglich- 
keiten zu sehen, wie es absolut bestimmt werden könnte, 


Wenn wir von der Hypothese ausgehen, daß "die Autoren" im Mittel gute Pro- 
grammierersind, kann man H/k als den Mittelwert von rz über alle Program = 
me, die existieren, ansetzen, Es wird dabei der "mittlere Programmierer" defi= 
niert, der H ebenso oft unterschätzt wie überschätzt, 


2 
Nun ist r=z/v also z= zu. 


Für eine repräsentative Stichprobe von untersuchten Programmen (vergl, Tabel- 
le 2) ist dieser Wert in Tabelle 1 aufgetragen. Der Mittelwert ist rz =21,41 
20 %, Die relativ geringe Streuung dieses Wertes erscheint in Anbetracht der 
Verschiedenartigkeit dieser Programme recht bemerkenswert, und man darf da= 
raus ableiten, daß unser "mittlerer Programmierer" eine brauchbare Vorstellung 
ist, 








TABELLE 1 
Progr. Nr ER =q TZ IZ p 
1 29,4 4,3 + 0,20 
2 23,4 2,0 +0,09 
3 22,4 150 + 0,05 
4 16,8 - 5,2 - 0,24 
5 2172 = Uo - 0,01 
6 16,4 - 5,6 - 0,26 
7 28,6 + 7,2 + 0,34 
8 16,9 - 4,5 - 0,21 
2 
DE: IE = I1LA 
— + + 
rz = 21,4 = 4,35 = 21,4 = 20% 
kun IzrIz ne 
Die Größe —— = A wollen wir die Überschußerw ähnung in Jo nennen, 
rz 


Es muß erwähnt werden, da diese Berechnung mit dem "mittleren Programmie = 
rer“, der seine Adressaten kennt, natürlich nur eine vorläufige Annahme sein 


kann, Sicheristz,B, die Konstante k des Adressaten z.B, altersabhängig, so daß 
‚M < © auch bedeuten kann, daß das Programm für ältere oder intelligentere 
Adressaten richtigist, Immerhin wird man vorläufig beim Programmieren richtig 
liegen, wenn man ja = O anstrebt, also rz = 21,4, 








Nun gibt es unter Programmierern den Begriff des "zerschnittenen Lehr- 
buchs", mit dem ein schlechtes Programm bezeichnet wird, 

Wenn man einen Lehrbuchtext in Abschnitte unterteilt, so kann man diesen un» 
terteilten Text als ein gestrecktes Programm betrachten mit den Abschnitten als 
Frames, Für diesen Text kann man das (m,i)-Diagramm aufstellen und die Zah- 
len ĝg und M ermitteln, Man erhält dann eine Vergleichsmoglichkeit zwischen 
Lehrbuchtexten und wirklichen Programmen, 


Dieses Verfahren birgt natürlich allerlei Probleme. Die wichtigste Schwierigkeit 
ist die, in welche Stücke der Text zerschnitten werden soll, Wenn man vergleich- 
bare psychologische Lerneinheiten haben will, so müßte man wissen, wieviel 
Wörter, Sätzeoder Abschnitte des Textes von einem Adressaten durchschnittlich 
gelesen werden, ehe er eine Denkpause macht, Wir nehmen vereinfachend an, 
daß man grammatische Trennstellen als Framegrenzen heranziehen kann, Eine 
Denkpause wird ohnehin mit großer Wahrscheinlichkeit mit einem Satzende zu- 
sammenfallen, Die einfachste Möglichkeit ist hier 


1 Satz = 1 Frame zu rechnen, 


Eine andere Möglichkeit ist die, sinnvolle Satzgruppen als Lehrschritte zu zih~ 
len, Insbesondere eignen sich für diese Art der Textzerlegung Lehrbuchtexte aus 
Lehrbüchern, die schon an sich in relativ kurze Sinnabschnitte zerteilt sind. Hier 
kann man vermuten, daß der Autor sich über eine sinnvolle Absatzgebung bereits 
Gedanken gemacht hat und den Schüler durch diese Absätze zwingen will, an den 
betreffenden Stellen Denkpausen zu machen. Ein Lehrbuch, welches derartig 
kurze Abschnitte hat, ist das Physiklehrbuch "Grimsehl, Bd. 1" (Klett-Verlag), 
Es wurden für den Abschnitt "Photometrie" dieses Lehrbuchs (m, i)-Diagramme 
hergestellt, und zwar 


1. Nach Sätzen zerlegt, 
2, Nach Abschnitten zerlegt, 


Die Ergebnisse zeigt Tabelle 2, die mit Tabelle 3 verglichen werden möge. 


TABELLE 2 
zerlegt nach v z i e MW 
Sätzen 1:7 3,2 17 0,47 - 0,73 


Abschnitten 3,4 5,8 lL 0,41 - 0,54 





Nr. Verfasser Titel 


Mittlerer 
Begriffs- 
fortschritt 
Begr. /Frame 
v 
1 Eher Elektro- 0, 56 
technik. 
Das Atom 
2 Anschiitz Lichttech- 0,72 
nik 
3 Zielinski Suezkanal 1,45 
4 H.Lindner  Mengen- 0,73 
algebra 
5 Zielinski Meißel- 1,00 
schneide . 
6 Ludwig Wetter ER 1.577 
Mensch 
7 Zielinski Viskosität 0,71 
8 Becher Binäres Zah- 4,7 


(Westermann) lensystem 


Mittlerer 

Begriffs- 

inhalt 

Begr. /Frame 
pri 


3,8 


4,1 


8,7 
3,0 
4,6 


9,4 


4,7 
8,9 


TABELLE 3 


Frame- Relative Überschuß-  Repeti- 


zahl i Begrifis-  erwahnung tionen 
redundanz %. 10” r 
== 

= A 
104 0,85 +0,2 6,8 
150 0,82 +0,09 o, 8 
To 0,75 +0,05 3,9 
95 0,79 - 0,24 4,8 
41 0,78 - 0,01 4,6 
9 0,67 - 0,26 3,0 
47 0,82 + 0,34 6,1 
18 0,47 - 0,21 1,9 


+) Dieses’ Programm wurde für auditive Präsentation entworfen, 
Die unmittelbare Vergleichbarkeit der Zahlenwerte für seinen eigentlichen Verwendungszweck ist 


daher nicht gesichert, 
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BIOLOGISCHE "SOLL"-WERTE ALS STATISTISCHE GRÖSSEN 
von Martin Hengst, Berlin 
1. Vorbemerkung 


Lebende Organismen reproduzieren bestimmte Merkmalswerte trotz wechseln- 
der Umweltseinflüsse mit einer erstaunlichen Präzision, Beispiele hierfür sind 
die Konstanz von Blutdruck, Körpertemperatur oder Herzfrequenz der einzelnen 
Individuen, In Analogie zur Technik versuchen wir diese Konstanz biologischer 
Größen alsErgebnis von Regelungsvorgängen zu verstehen, indem wir uns Orga - 
nismen als eigengesetzliche Systeme sehr vieler Elemente und Elementarpro- 
zesse vorstellen, zwischen denen kreiskausale Zusammenhänge bestehen, die 
also gewissermaßen rückgekoppelt und dadurch weitgehend von systemfremden 
Einflüssen unabhängig werden, Dieses als Regelkreislehre bezeichnete Denkmo- 
dell (Schmidt 1964) versucht, biologische Systeme und ihre Verhaltensweisen 
ohne teleologische Begriffe zu beschreiben, Trotzdem hat man in einer etwas 
kurzschlüssigen Analogie zu technischen Reglern die erwähnten biologischen 
Größenals "Soll"-Werte bezeichnet und damit überflüssigerweise den Teleolo- 
giebegriff wieder ins Spiel gebracht, Es erscheint uns aber gerade ein Verdienst 
der Regelkreislehre, ihre Denkmodelle konsequent auf dem Begriff der Kausali- 
tät aufzubauen, 


Auf die logische Unstimmigkeit des "Sollwert" -Begriffes hat bereits Schaefer 
(1960) hingewiesen, der biologische Sollwerte als empirische Istwerte auffaßt, 
"die man ihrer Häufigkeit (d.h, ihrer Normalität) wegen zu Sollwerten erklärt 
hat," Ein solcher statistischer Aspekt biologischer Größen ist nicht neu, Er be- 
gegnet uns bereits 1879 bei Galton und Mac Allister, welche die Variation von 
Reaktionen auf sensorische Stimuli beschrieben, 


Spätererkannte Kisskalt (1915), daß die S-förmigen Dosis-Wirkungskurven, die 
den Prozentsatz positiv reagierender Tiere als Funktion der Dosis wiedergeben , 
nichtsanderes als S(%)-Linien, also integrierte Häufigkeitskurven sind, Rautmann 
(1921) definierte den empirisch gefundenen häufigsten Wert eines Kollektivs 
physiologischer Merkmale als Norm, De Lind van Wijngaarden (1926) bewies 
durch umfangreiche Versuche mit Digitalis an Katzen experimentell den stati- 
stischen Charakter pharmakologischer Größen. Seitdem haben zahlreiche Forscher 
durch experimentelle und theoretische Arbeiten die Methoden zur Bestimmung 
pharmakologischer Normen weiter ausgebaut, Insbesondere vereinfachte Gaddum 
(1933) die grafische Darstellung der Dosis-Wirkungskurven und damit auch die 
Auswertung pharmakologischer und serologischer Untersuchungen, Schließlich 
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wies Hengst (1938) darauf hin, daß jede biologische Norm als statistische Grö- 
Be aufgefaßt und gemessen werden kann, Er verglich den physiologischen Nor- 
malzustand mit einem statistischen Gleichgewicht, bei dem sich der Zustand 
zwar fortwährend verändert, aber um eine Mittelwertslage pendelt, von der er 
sich nur selten weit entfernt. Die Kenntnis der Gleichgewichtslage allein ge- 
nügt noch nicht, um die biologische Norm hinreichend zu kennzeichnen; man 
muß auch wissen, wie sich die Einzelwerte um die Norm (Gleichgewichtslage) 
verteilen und die Weite des Pendelausschlages kennen, 


Biologische Normen sind also keine Konstanten, sondern variieren von Organis- 
mus zu Organismus und - bei ein und demselben Organismus = mit der Zeit. Sie 
sind gewissermaßen "Eigenwerte" des betreffenden biologischen Systems, die 
allein mitseiner Stabilität verträglichsind, Ihre Schwankungen sind unvermeid- 
liche Folgen der sie erzeugenden Regelungsmechanismen, Wacholder (1952) führt 
insbesondere die intraindividuelle Variabilität, d.h, also die Schwankungen der 
Werte beim einzelnen Lebewesen auf die allgemein-physiologische Organisation 
aller Lebewesen zurück, die nachihm auf dem Prinzip eines dynamischen Gleich 
gewichts und der Rücksteuerung auf dieses Gleichgewicht bei allen Abweichun- 
genberuht, Diese Rücksteuerungerfolgt bei niederen Lebewesen allein schon auf 
Grund derEigentümlichkeiten des Stoffwechsels wie z.B. der Reversibilität oder 
des Massenwirkungsgesetzes, bei höherer Organisation dazu noch über besondere 
humorale und nervöse Regulationsmechanismen. 


2. Verteilungsgesetze biologischer Normen 


Die Variationen biologischer Größen führt sofort zur Frage nach einem Vertei- 
lungsgesetz, dem sie gehorchen müssen, damit man überhaupt von einer Norm 
sprechen kann, 


Ordnet man Meßzahlen biologischer Merkmale einer bestimmten Art oder Gat- 
tung der Größe nach, so wird man sehr oft feststellen, daß an den beiden Enden 
der Zahlentolge die extremen Werte relativ selten und in immer größeren Ab- 
ständen auftreten, während sich die Beobachtungsdaten nach der Mitte zu drän- 
gen. Faßt man die Meßzahlen nach Gruppen von mehreren Meßeinheiten zu- 
sammen, so sind diese Klassen nach den Enden zu nur vereinzelt, in der Mitte 
dagegen immer stärker besetzt, Stellt man eine solche Meßreihe, die an etwa 
50 oder 100 Organismen gleicher Art gewonnen wurde, in der Weise dar, daß 
man in der Waagerechten die Meßwertklasse abträgt, in der Senkrechten dage- 
gen die Häufigkeit der Besetzungjeder Klasse, und verbindet man dann die Häu- 
figkeitswerte durch eine Linie, so erhält man sehr oft eingipflige Kurven, die 
im Idealfall glockenförmig, häufig jedoch auch asymmetrisch verlaufen (Abb, 1). 


—=————————————— 
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Anzahl 
Z 





Bild 1 


Mundtemperatur 


Solche eingipfligen symmetrischen oder asymmetrischen Kurven entstehen er- 
fahrungsgemäßimmer dann, wenn für die Ausprägung der kennzeichnenden Ei- 
genschaften tatsächlichnur ein Haupteinfluß maßgebend war, und alle ande- 
ren Einflüsse als Nebenursache nur ein Pendeln um diesen Wert bewirken. Mehr = 
gipflige Häufigkeitskurven deuten dagegen auf mehrere Haupteinflüsse neben 
vielen Nebenumständenhin, Eingipfligkeit der Häufigkeitskurven ist dem- 
nacheine notwendige -wenn auch durchaus nicht hinreichende - Be= 
dingung für das Vorherrschen eines Hauptgrundes, d.h. für die Existenz einer 
Norm und damit für die Reproduzierbarkeit unserer Beobachtungen, Eine ausrei- 
chende Kennzeichnung der jeweiligen Beobachtungswerte besitzen wir aber 
zweifelloserst dann, wenn wir ihr Verteilungsgesetz wenigstens angenähert ken» 
nen, 


Dieses Verteilungsgesetz läßtsichin doppelter Weise darstellen und formulieren; 
als Häufigkeitsverteilung und als Summenfunktion, die nichts 

anderes als eine aufsummierte Häufigkeitsverteilung ist. Die Häufigkeitsvertei- 
lung zeigt uns, welcher relative Anteil der Beobachtungsdaten zwischen 
zwei Grenzwerten liegt, die Häufigkeitssummenverteilung den Anteil bis zu 
einem Grenzwert, Beide Formen des Verteilungsgesetzes haben ihre Vorzüge und 
Nachteile; Einheitlichkeit und Symmetrie der Kollektive lassen sich einprägsam 
durch Häufigkeitskurven veranschaulichen, ihre Ausbreitung wird - besonders bei 
asymmetrischer Struktur = besser durch Summenkurven dargestellt. Summenkur- 
vengestattenaußerdem auch die Darstellung und Auswertung reduzierter Vertei- 
lungstafeln mit ungleicher Klasseneinteilung und ermöglichen gegebenenfails 
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die graphische Ableitung von Häufigkeitskurven mit äquidistanten Klassen, Zu» 
fällige Schwankungen, die besonders in den schwach besetzten Randklassen die 
Einheitlichkeit der Häufigkeitskurven beeinträchtigen können, wirken sich bei 
Summenkurven in den mittleren und Endklassen weniger stark aus, da sich die 
Kurve durch die Aufsummierung gewissermaßen selbst glättet, 


Da sich Gestalt, Lage und Ausbreitung als wichtige Eigenschaften 

von Verteilungskurven erwiesen haben, liegtes nahe, sie durch geeignete mathe» 
matische Ausdrücke zahlenmäßig exakt zu erfassen, Die Gestalt läßt sich 
exaktnurdurch den analytischen Ausdruck einer Verteilungsfunktion y = 
f{x) wiedergeben, Lage und Ausbreitung versucht man durch geeignete 
Kenngrößen (Parameter) wie Mittelwert und Streuung möglichst ein - 

deutig zu erfassen, 


Theoretische Verteilungen (Verteilungsfunktionen) lassen sich unter 
gewissen Voraussetzungen, also unter der Annahme sogenannter Modelle (Ver 
suchsanordnungen, Urnenziehungen), theoretisch ableiten, wie z.B. die soge- 
nannte Normalverteilung. Nun bewähren sich Gaußsche Normalvertei- 
lungen zwar recht gut in der Physik und Technik, versagen jedoch oft bei der 
Darstellung biologischer und medizinischer Größen, die in den meisten Fällen 
mehr oder weniger asymmetrische Verteilungen bilden, worauf bereits Fechner 
(1897) nachdrücklich hingewiesen hat. Es hat sich jedoch gezeigt, daß auch 
schiefe Häufigkeitsverteilungen symmetrisch werden, wenn statt der gemesse- 
nen Werte ihre Logarithmenals Abszissen aufgetragen werden. Wir sprechen dann 
von logarithmisch-normalen bzw, lognormalen Verteilungen, deren Theorie ein- 
gehend von Aitchison und Brown (1957)sowie kurz von Gebelein und Heite (1951) 
behandelt worden ist, 


Wir könnten uns natürlich damit begnügen, die Genauigkeit, mit der irgend- 
eine Häufigkeitskurve empirische Daten beschreibt, als ausreichendes Kriterium 
ihrer Brauchbarkeit zu betrachten, Es gibtjedoch zwei wichtige Gründe, nach 
theoretischen Ableitungen von Häufigkeitskurven zu suchen: einmal möchten wir 
z.B. eine klarere Einsicht in die zugrundeliegenden Prozesse gewinnen, Solche 
Kenntnisse werden zu weiteren Anwendungen der Verteilungsgesetze anregen . 
Außerdem erleichtert uns die Kenntnis der elementaren Voraussetzungen, unter 
denen das betreffende Häufigkeitsgesetz abgeleitet wird, seine eventuelle Modi- 
fizierung, umesneuen und anderen Sachverhalten anzupassen, Aus diesen Grün- 
den istes oft befriedigender, ein Häufigkeitsgesetz zu benutzen, für das wir eine 
plausible Herleitung kennen, und wir uns nicht nur auf eine mebr oder weniger 
zufällige empirisch gefundene phänomenologische Beschreibung der empirischen 
Daten stützen müssen, 








lo 


KH. 


Kapteyn (1903) hat eine Vorrichtung konstruiert (Abb. 2), die - ähnlich dem 
Galtonschen Brett - die Entstehung schiefer Kurven veranschaulicht. Er nimmt 
dabei an, daß jede neu hinzutretende Abweichung von der Gleichgewichtsla ge 
um so kleiner ist, je stärker das Merkmal bereits vom Mittelwert abweicht, Die- 
se Annahme ist offenbar für rückgesteuerte Systeme sehr plausibel, bei denen 
sicher die Wahrscheinlichkeit, von der Gleichgewichtslage stark abweichende Zu- 
stände anzunehmen, mit zunehmender Abweichung immer geringer wird, 


3. Das Wahrsche inlichkeits-Netz (WN) 


Um empirische Größen darauf zu prüfen, ob sie einem normalen oder lognor- 
malen Verteilungsgesetz gehorchen, bedient man sich zweckmäßigerweise gra- 
phischer Methoden, 


Die S-förmige Prozentsummen-Kurve der Normalverteilung läßt sich - besonders 
im Bereich der kleinen und großen Prozentsummen - nur schwer genau zeichnen, 
Man benutzt daher nach Henry (1894) für ihre Darstellung Koordinatenpapiere, 
deren Ordinaten nach dem Gaußschen Integral so geteilt (Abb. 3) sind, daß Pro- 
zentsummenkurven von Normalverteilungen zu Geraden gestreckt werden, An- 
fang undEnde der Prozentsummengeraden lassen sich allerdings nicht zeichnen, 
da die normale Häufigkeitskurve ja im negativen Unendlichen beginnt und im 
positiven Unendlichen erst endet, Im allgemeinen beginnen die Ordinaten der 
Wahrscheinlichkeits-Netze bei 0,02 % und enden bei 99,8 Jo. 
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Kurvenblan zum Festlagen des Zufalltstreubareiches im Wahrscheinlichkeitsnetz 
DER beidentige Schar! ach Hasena Wärnen 
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Bild 3 Bild 4 


Die Auswertungempirischer Prozentsummenverteilungenim WN bietet eine Rei- 
he von Vorteilen: 


1. Manerkennt leicht, ob die Punkte annähernd auf einer Geraden liegen, d.h, 
ob überhaupt eine Normalverteilung vorliegt und Mittelwertbildung und Streu- 
ungsmaß sinnvoll sind, 


2. Man benötigt für die Auswertung im WN nicht unbedingt äquidistante Merk- 
malseinteilungen (gleiche Klassenbreiten). 


3. Mittelwert und Streuung lassen sich ohne Rechnung bequem aus der graphi- 
schen Darstellung - Zeichnung der "besten" Geraden - im WN ablesen, 


Hat man die zu den einzelnen Meßwerten x. gehörenden Prozentsummenwerte 
in das WN eingetragen, so legt man - mehr oder weniger willkürlich nach Au= 
genmaß -eine beste Gerade hindurch, Die Abszisse des Schnittpunktes der durch 
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den 50 %-Ordinatenwert gehenden Parallelen mit der Geraden liefert einen 
brauchbaren Schätzwert für das arithmetische Mittel x. Entsprechend liest 
man die Werte x - sundx + s als Abszissenwerte der Schnittpunkte der 16 Jo - 
bzw. 84 %-Linie mit unserer Geraden ab, Die Differenz beider Werte liefert 2s 
und damit einen Schätzwert fürs (vgl. Abb. 3), Wenn also empirisch gewon = 
nene Prozentsummenwerte beim Einzeichnen in das WN bzw. log WN auf einer 
Geraden liegen, soweißman, daß eine normale Verteilung vorliegt. Je nach 
dem Umfang der Beobachtungsreihen sind größere oder kleinere Abweichungen 
voneiner Geraden zu erwarten, da ja jede Beobachtungsreihe streng genommen 
nur eine mehr oder weniger große Stichprobe darstellt, Die für die einzelnen 
Punkte der Summenprozentgeraden zulässigen Zufallsabweichungen kann man 
ohne jede Rechnung mit hinreichender Genauigkeit entsprechenden Kurvenblät- 
tern entnehmen, die ebenfalls im Handel erhältlich sind (Abb. 4). 


Die besondere Bedeutung der Normalverteilung macht es verständlich, daß man 
asymmetrische Verteilungen durch geeignete Merkmalstransformationen in nor« 
male Häufigkeitskurven überzuführen sucht, Das gelingt häufig, wenn man die 
S(%)"Linie nicht über den oberen Klassengrenzen, sondern über ihren Logarith- 
menaufträgt. Man benutzt dazu WN, deren Abszissen bereits logarithmisch ge- 
teilt sind (vgl. Abb, 5). 
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In diesen Fällenerhält man aus den Abszissen der Schnittpunkte unserer Geraden 
mit der 16 %- bzw. 84 Jo-Parallelen einen Faktor, durch den man das geome- 
trische Mittel der X, dividieren bzw, mit dem man es multiplizieren muß, um 
einen Bereich zu erhalten, in dem wieder 68,3 % aller X, liegen, 


4. Beispiele 


Nach den hier geschilderten Methoden sind bereits zahlreiche biologische und 
medizinische Normen aus empirischen Daten gewonnen worden, So hat z.B, 
Harting (1952) die Durchmesser von roten Blutkörperchen im WN mit numeri- 
scher Merkmalsskala auf Grund von 5000 Messungen nach Price=Jones (1929) 
dargestellt (Abb, 3). Eine entsprechende Auswertung von Serumkalkwerten 
im logarithmischen WN teilt Proppe (1952) mit (Abb, 5). 


Manche empirische Verteilungen ergeben auch im lognormalen WN noch ge 
krümmte Kurven, In solchen Fällen erhält man u, U, erst Geraden, wenn man 
nicht log x, sondern log (x*c) oder log(C*x) auf der Abszisse des WN abtragt. 
Diese additiven Konstanten c bzw, C geben oft interessante Hinweise über 
Grenzwerte, die das untersuchte Merkmal nach oben oder unten begrenzen, 


So zeigt die Abb, 6 nach Hengst (1952) die Summenprozentlinie der Blutungs- 
zeiten nach oberflächlichem Schnitt in das Ohr, die an vollständig normalen 
Kaninchen von Fleisch und Tripol (1942) bestimmt worden sind, über logarith- 
mischer Scala aufgetragen. Diese Kurve ist im unteren Teil nach links abgebo- 
gen. Addiert man vor der Logarithmierung zu den Klassengrenzwerten der an= 
gegebenen Blutungszeiten jeweils 20 Sekunden, so erhält man die mit +++++ ge» 
zeichnete Gerade. Die Blutungszeiten weisen also dann eine reine Gaußvertei- 
lung auf, wenn man als charakteristische Zeit einen um 20 Sekunden vergrö - 
Berten Wert wählt. Die Abweichungen der obersten vier oder fünf Punkte von der 
Geraden deuten auf ein Teilkollektiv hin, dessen Zentralwert doppelt so groß ist 
wie der des Hauptkollektivs und das evtl, durch eine mechanische Entfernung 
des Thrombus hervorgerufen sein kann, eine Möglichkeit, auf die bereits die 
Verfasser hingewiesen haben, 


Die Konstante c = 20 1äßt sich also graphisch durch ein Näherungsverfahren er- 
mitteln, indem man zunächst versuchsweise einen beliebigen Wert von c wählt. 


Erhält man dabei wieder eine nach links oben gekrümmte Linie, so war c noch 
zu klein; andernfalls erhält man eine nach rechts unten gekrümmte Kurve, 
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Vielfach beobachtet man auf medizinischem Gebiete asymmetrische Vertei- 
lungskurven, die rechtsseitig steil abfallen, die sich also gewissermaßen als 
Spiegelbilder der bisher behandelten auffassen lassen. Ein anschauliches Beispiel 
hierzubildet die Verteilung der Mundtemperaturen von 350 fieberfreien Patien- 
ten der Kieler Hautklinik, das Proppe (1952) behandelt, Faßt man die zwischen 
35,20 und 37,50 C liegenden Meßwerte in Klassen der Breite 0, 30 C zusammen, 
so erhält man eine Kurve, die über 35,20 und 35, 60 bis zu 36, 50 flacher an= 
steigt, als sie von 36, gl auf 37,40 abfällt (Abb. 1). 
















er USES IIS 
er kr 
yo 
99 4 
g8 I 
ĝi E o 
“FES 
ka EE/A „LL 
37 EZ = ESEI 
Oj Ta AB I BR I 
eĉ ŝ a a: A ER 
rdo = ER GE ER 
EERZEHEE 
5 / 
70 
error 
Ŝ 
A TITI/I BEE 
— rr FH 
Do po = po pe doj 
“(= ei geiz 
7 LLM = 


Diese Verteilung läßt sich durch die Transformation log(C-x) normalisieren, 
wenn wir C etwa gleich 42“ C setzen (Abb, 7). Die Summenprozentlinie ge= 
winnen wir hier in der umgekehrten Reihenfolge, d.h, wir beginnen mit der 
Aufsummierung bei den Werten für C = 37, 50 = 4, 50, Der Fluchtpunkt der Ver- 
teilung rückt hier also in den Bereich von 410 bis 42° c. Proppe bemerkt ab- 
schließend: "Für die Erkenntnis des Mechanismus der Temperaturregulierung 
dürfte es dabei bemerkenswert sein, daß die Temperatur des menschlichen Or- 
ganismus nicht auf einen mittleren Normwert, sondern auf eine Differenz ge- 
genübereinem nicht überschreitbaren Grenzwert einreguliert wird. In ähnlicher 
Weise läßtsichaus den bei verschiedenen Krankheiten oft sehr unterschiedlichen 
Häufigkeits-Verteilungen des Sterbealters immer wieder erkennen, daß die Le= 
besndauer des Menschen sich auf eine Differenz gegenüber dem Grenzwert von 
etwa 125 bis 130 Jahren einspielt. " 
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ZUR FRAGE DES AUSWENDIGLERNENS 
von Felix von Cube 


(Erwiderung auf die Kritik von Herrn Karl Eckel in den GrKG 5/1) 


In meiner Arbeit "Über ein Verfahren der mechanischen Didaktik" (von Cube, 
1961) habe ich die Theorie aufgestellt, daß sich ein auswendigzulernender Text 


derart zerlegen läßt, daß seine ursprüngliche Information 


= . ldm bit 
I m m bi 


subjektiv herabgesetzt wird, Zu diesem Zweck wird der Text in q "Wörter" 
zu je p "Buchstaben" eingeteilt, wobei die Bedingungen 


q>1i ud q. p = m 


gelten sollen, Die Information eines "Wortes" wird (nach der genannten Theorie) 
auf diese Weise 


L = p. ldp bit, 


die Gesamtinformation der "Wörter" also 


I, = q. p. Idpbit, 


Für das Zusammenfassen der "Wörter" in der richtigen Reihenfolge wird sodann 


noch eine zusätzliche Information von 


I, = q. ldq bit 


benötigt. Aus der Beziehung 


I, =d. p. ldprq, ldq bit (1.: subjektive Inf. ) 


ergibt sich dann das Minimum von I S durch die Bedingung 


= o E 
ldp Idm m. 
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Mit Hilfe dieser Formel kann also ein gegebener Text der Linge m so aufgeteilt 
werden, daß seine subjektive Information ein Minimum wird, 


Herr Eckel machte nunmehr den Einwand, daß die Information eines Textbruch- 
stückes mit p Elementen nicht 


L = p. (dp bit 


sondern 
l = p. ldm bit 


betrage; das würde bedeuten, daß jedes der p (zusammengefaßten) Zeichen mit 
der Information 


I = ld bit, 
7 m l 


d.h. also mit seiner ursprünglichen Information auftritt, 


Der Einwand von Herrn Eckel scheint mir jedoch die Unterscheidung von subjek- 
tiver und objektiver Information nicht genügend zu berücksichtigen, Es ist ganz 
klar (dazu ist die von Herrn Eckel angestellte Rechnung auf S. 32 gar nicht not- 
wendig), daß sich im Bereich der objektiven Information durch keine noch 
so raffinierte Aufteilung eine Informationsverringerung erzielen läßt: Wenn je- 
des Zeichen die Information | 


I, = ldm bit 


hat, bleibt bei jeder Einteilung die Gesamtinformation des Textes 


L. = m. ldm bit, 
Die "mechanische Didaktik" überschreitet indessen den Bereich der objektiven 
Information; sie will zeigen, daß durch bestimmte Maßnahmen eine gegebene 
Information subjektiv herabgesetzt werden kann, Wir wollen dies zunächst 
qualitativanhandeiniger Beispiele erläutern: Hat man ein längeres Gedicht aus» 
wendigzulernen, so ist es ein Unterschied, ob man sämtliche Strophen auf ein» 
mal ins Auge faßt, oder zunächst nur eine Strophe oder nur eine Zeile, 
Beim Auswendiglernen einer Zahlenfolge macht es einen erheblichen Unter- 
schied, ob ich für eine längere Folge das Repertoire der zehn Ziffern zugrunde 


23 


legen mu8, oder bei einer ersten Teilfolge nur zwei oder drei Ziffern (vgl. hier- 
zu auch die Beispiele von Herrn Eckel, S. 32). 


Das Wesentliche bei solchen Vorgängen ist folgendes: Es ist (unter Umständen) 
von Vorteil, wenn man beim Auswendiglernen eines Textes bewußt auf das ge- 
samte Repertoire verzichtet und sich zunächst nur auf einen noch näher zu be- 
stimmenden Teil beschränkt, Auf diese Weise kann für das den Text lernende 
Subjekt eine Informationsverringerung erzielt werden. 


Esist Herrn Eckel zu danken, daß er durch seine Kritik auf die (stillschweigende) 
Voraussetzung, daß das lernende Subjekt diesen Vorgang durchzuführen, d.h, al- 
so das Repertoire (wie Herr Eckel sagt) “einzuengen" vermag, aufmerksam ge» 
macht hat, Tatsächlich ist nur unter dieser Voraussetzung (die mir allerdings in 
der Praxis weitgehend erfüllt zu sein scheint) die subjektive Information eines 
Textbruchstückes von p Elementen 


= „ Jap. Dit, 
Io p p bi 
Eine ausführlichere Formulierung der "Theorie der mechanischen Didaktik" 
müßte demnach folgendermaßen lauten; 


Unter der Voraussetzung, daß ein lernendes Subjekt sein (subjektives) Repertoire 
in einem bestimmten, experimentell noch zu präzisierenden Bereich "einzuen- 
gen" (oder aufzubauen) vermag, gibt die "Theorie der mechanischen Didaktik" 
an, in welcher Weise dies zu geschehen hat, damit eine minimale subjektive 
Information erzielt wird. (vgl. hierzu auch von Cube, 1964), 


Schrifttumsverheichnis 
von Cube, Felix Über ein Verfahren der mechanischen Didaktik, 
GrKG 2 (1961) H. 1 


von Cube, Felix Kybernetische Grundlagen des Lernens und Leh- 
rens, Stuttgart, 1964 


Eckel, Karl Über den Zusammenhang von "Repertoire" und 
"Superzeichen", GrKG 5/1 (1964) 


Eingegangen am 4. Januar 1965 





NACHWORT DER SCHRIFTLEITUNG 


Die Schriftleitung möchte mit dieser Erwiderung die Auseinandersetzung um die 
"mechanische Didaktik" vorläufig abschließen. 


Die bisherige Diskussion hat klargestellt, daß sich die durch von Cube vertrete- 
ne Möglichkeit 


I. <x mldm 


nicht schon auf der Ebene der mathematischen Informationstheorie bestätigen 
läßt, sondern daß sie auf der höheren Ebene der informationellen Systemtheo- 
rie diskutiert werden muß, denn es muß wenigstens als Möglichkeit gezeigt 
werden, wie ein informationsaufnehmendes System S ein geeignet wechselndes 
Repertoire zugrundelegt. 


Offenbar werden für S zunächst zwei Speichereinheiten postuliert: ein "Kurz - 
speicher", inwelchen die Information unmittelbar aufgenommen wird, und ein 
"vorbewußtes Gedächtnis", in welches sie vom Kurzspeicher her eingelernt wird. 
Die jeweilserforderlichen Zeiten sind informationsproportional. In diesem Sin- 
ne bezieht von Cube die subjektive Information offensichtlich nicht auf die Auf» 
nahmezeitin den Kurzspeicher, denn beim Lesen des ersten Zeichens kann noch 
nicht bekannt sein, welche p von m verschiedenen möglichen Zeichen im er- 
sten Wort der Länge p vorkommen werden. Die Information pro Zeichen muß 
also, wie Eckel betont und von Cube nicht bestreitet, für den Kurzspeicher zu- 
nächst mit Idm beziffert werden. 


Nachdem jedoch die gesamte Zeichenfolge gelesen wurde, ist im Prinzip eine 
Superierung möglich, Zusätzlich zu den Informationsmengen q. p. ldp und 
q. ldq muß dann noch festgehalten werden, welches das jeweilige Repertoire 
von p Buchstaben ist (z.B. durch Speicherung der q verschiedenen Codes). Das 
Problem, auf welches die Auseinandersetzung führte, lautet also, einen Algo- 
rithmus und ein diesen darstellendes System S anzugeben, so daß nicht nur die 
Einengung auf je eines von q verschiedenen Repertoires zu je p Elementen dar- 
gestellt wird, sondern dies auch noch in der Weise geschieht, daß auch unter 
Mitberücksichtigung der "Umschaltzeit" auf das jeweils neue Repertoire noch 
die Lernzeit kürzer ist als ohne Superierung. Die Lösung dieses Problems ist si- 
cher nicht in trivialer Weise durch Hinweis auf schon bekannte technische Mo- 
delle zuerbringen. Denn für die üblichen technischen Übertragungskanäle bzw. 
Speicher g’"* die "objektive" Information die nicht unterschreitbare Grenze der 
Übertragungszeit bzw, des Speicherplatzes an, so daß auch durch zusätzliche 
Übermittlungbzw. Speicherung wechselnder Codes keine weiteren Einsparungen 
möglich werden, 
Die Schriftleitung 
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UNTERSUCHUNG DER VERMUTUNG J.D. WILSONS ÜBER DEN VERFASSER 
DES ERSTEN AKTES VON SHAKESPEARES KING HENRY VI, FIRST PART” MIT 
HILFE EINFACHER TEXTCHARAKTERISTIKEN 


von Joachim Thiele, Uetersen 


John Dover Wilson macht in seiner Edition (1952) der Shakespeareschen Königs- 
dramen auf Grund einer Reihe stilistischer und inhaltlicher Eigentümlichkeiten 
geltend, daß der ganze erste Akt des ersten Teils von "King Henry VI" und eine 
Reihe von Szenenfragmenten aus dem dritten und fünften Akt mit hoher Wahr- 
scheinlichkeit von Thomas Nashe 7) geschrieben seien, 


Die Bestimmung der beiden Textcharakteristiken i und r (i =mittlere Silben- 
zahl/Wort, r = mittlere Länge der Ketten aus gleichsilbigen Wörtern im Text) 
einiger Abschnitte von "1 Henry VI", I und einiger Proben aus sicher von Shake- 
speare stammenden Szenen sowie einiger Abschnitte aus einem kurz nach der 
Veröffentlichung von "1 Henry VI" geschriebenen Stück Nashes (McKerrow, 1905) 
ergibt die in Tabelle 1 angegebenen Werte. 


Es wird vorausgesetzt, daß zur gleichen Zeit verfaßte Arbeiten eines Autors, die 
der gleichen Literaturgattung zuzurechnen sind, im Mittel gleiche Textkonstan- 
ten aufweisen, 


Tabelle 1 und Bild 1 zeigen, daß die Vermutung Wilsons, "1 Henry VI“ I. Akt 
stamme von Nashe, auch aus den statistischen Daten der Texte wohl zu begrün- 
den ist. 


1) Thomas Nashe (oder Nash), geb. 1567 zu Lowestoft in Suffolkshire, Student 
am St. John% College in Cambridge, lebte seit etwa 1590 in London und starb 
dort 1600 oder 1601. 1593 schrieb er die satirische Komödie Summers last will 
and testament”; die Probetexte wurden diesem Stück entnommen. 
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I — — 
| No l 5 
| William Shakespeare 
: 
& 
| 1 Comedy of Errors I, 1,2 1,1,31-95 496 
Ei , 28 2, O 
' (1592/93) 2, 1-74 566 | ; i 
| 
| 2 1 Henry VIIL,4 11,4, 1-61 492 1,25 2,64 
| (1589/90) 
| 008 62-134 572 1,81. #2,83 
| 3 Henry VI V,6 V,6, 1-43 345 
| 4 (1590/91 1,28 2,6 
) lii i 44-93 413 aki 
Mittelwert 1746 2,98 
Thomas Nashe 
Summers last will | 
1 (1593) 635-688 424 181  2,48 
2 689-741 405 1,31 2,28 
3 1149-1199 376 1,36 2,26 
Mittelwert 1:82 2,34 
1 Henry VI, I 
1 1,1,1-56 431 1592 2,830 
2 108-156 372 1, 34 2,09 
3 I, 4, 1-56 439 } 
33 2,8 
57-111 440 “ : 
Mittelwert 1, 33 2,26 
(0 


N = Anzahl der Wörter des Abschnitts 








134 Oo 


132 


130 


128 


126 


Schrifttumsverzeichnis 


RonaldB. McKerrow 


John Dover Wilson 


Eingegangen am o. Januar 1960 
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X Shakespeare 
+ Nashe 
o 1Henry WI 


MW = Mitteiwert 





“A Pleasant Comedie, called Summers Last 
Will and Testament ”, written by Thomas 
Nash. London, by Simon Stafford, 1600, ab- 
gedrucktin: The Works of Thomas Nashe, edi- 
ted from the original texts by Ronald B. Mc- 
Kerrow, TextVol. 3, London 1905, S. 231 ff. 


William Shakespeare; The First Part of KING 
HENRY VI, edited for the syndics of the Cam- 
bridge University Press by John Dover Wilson, 
(Vol. 21 der Gesamtausgabe) Cambridge 1952, 
S, XXI ~ XXXI. 
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ZUR WORTRANGKORREKTUR BEI DER AUTOMATISCHEN STICHWORT- 
ANALYSE 


von Helmar Frank (Waiblingen), Berlin 


Bergmann, Frank und Großer (1963) waren davon ausgegangen, daß sich der se- 
mantische Gehalt eines Textes normalerweise (d.h. wenn nicht der Effekt ab- 
sichtlich durch geeignete Verwendung von Synonymen und Umschreibungen kom- 
pensiert wird) durch eine Verringerung des Ranges derjenigen Wörter syntaktisch 
äußern werde, die als Stichwörter den Text semantisch kennzeichnen, Diese An- 
nahme hatte sich in erster Näherung bewährt, Es zeigte sich jedoch, daß in sehr 
vielen Fällen Wortrangverringerungen durch eine zu geringe Textlänge entste- 
hen können. Die Autoren berechneten (übrigens nur näherungsweise, da ihr Re- 
chengang eine nicht genannte Vernachlässigung enthält!) den Erwartungswert 
der Anzahl derjenigen Wörter, die einen geringeren Rang als ein gegebenes Wort 
haben würden, aber wegen der Kürze des Textes zufällig nicht auftraten, Aus 
dem Erwartungswert der so bewirkten Wortrangerniedrigung wurde rückwärts der 
(im folgenden näher zu definierende) "theoretische Rang" aus dem empirisch be- 
stimmbarenermittelt, Dieses Verfahren erwies sich zwar als praktisch brauchbar 
(wenn auchnicht als voll befriedigend), weist aber erhebliche theoretische Män- 
gel auf, 


1. Der empirisch bestimmbare Rang eines Wortes W, erniedrigt sich nicht nur 
dann, wenn ein an sich wahrscheinlicheres Wort zufällig überhaupt nicht auf- 
taucht, sondern allgemeiner auch dann, wenn es zufällig weniger häufig als W, 
benutzt wurde. 


2. Andererseits erhöht sich der empirisch bestimmbare Rang eines Wortes W,, 
wenn ein an sich unwahrscheinlicheres Wort zufällig häufiger als W, benutzt 
würde, 


3. Man kann den empirischen Rang r_ eines Wortes gegebenen theoretischen 
Ranges r , als Zufallsgröße betrachten wie umgekehrt auch den möglichen theo- 
retischen Rang r,, eines Wortes vom empirischen Rang r,. Bestimmt man den 
jeweiligen Erwartungswert r (rt ,) bzw. T, (r ), dann erhält man zwei Funktio = 
nen, von denen nicht notwendig die eine Umkehrfunktion der anderen ist, Die 
Autoren benutzten aber die Umkehrfunktion der als rn) interpretierten Funk- 
tion als En) 
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Eine schärfere, aber leider praktisch nicht brauchbare Methode zur Rangkorrek - 
tur vermeidet diese Fehler. Sie macht folgende Voraussetzungen: 


1. Wenn zwecks Ausdrucks eines Sachverhalts ein Text erzeugt wird, dann wird 
zunächst willkürlich eine Textlänge N bestimmt, 


2. Unabhängig von der gewählten Textlänge wird eine nur vom auszudrückenden 
Sachverhalt abhängige Urne mit Losen herangezogen, wobei jedes Los genau mit 
einem Wort W_ beschriftet ist, dasselbe st aber auf mehreren Losen stehen 
kann, derart, daß die relative Häufigkeit h “des Wortes k in dieser Urne sich 
ergibt aus 





mit A 


T 
(u) A 
h, =1 (r= Umfang des Wortschatzes), 
t=1 


(z und T sind als feste Konstanten anzunehmen) 


3. Der Textwird erzeugt durch Ziehen eines Loses, Abschreiben des darauf ste- 
henden Wortes, Zurücklegen des Loses in die Urne, Mischen, Ziehen des näch- 
sten Loses usf., bis die Textlänge N erreicht ish: Wr wird also für alle r bei je- 
der Ziehung mit der Wahrscheinlichkeit p h ' gezogen, kann aber bei klei- 


nem On Text mit einer von p. beträchtlich abweichenden relativen Häufig - 
keit h, auftauchen, 


Dieses Modell, das trotz seiner außerordentlichen Grobheit für das Verfahren 
von Bergmann, Frank und Großer selbst bei einer Anwendung unter zusätzlichen 
groben Vernachlässigungen brauchbare Resultate lieferte, betrachtet also nicht 
nur jeden Textals verdampft, sondern setzt voraus, daß der bibliothekarisch re- 
levante Teilseiner semantischen Information bereits in der Verteilung (p „) s y 
stecke, Sat dieser Verteilung kann aber dem empirischen Text nur die Vertei - 
lung { h }= f entnommen werden, Welches ist der Erwartungswert des. Ran~ 
ges r,, den ein Wortin NM hat, wenn sein Rangin $ alsr bestimmt wurde? 
Dieser Zusammenhang ste llt die gesuchte Wortrangkorrektur dar. Aus der Unter- 
suchung von Bürmann, Frank und Lorenz (1963) ergibt sich, daß bei wissenchaft = 
lichen Texten z = 2 gesetzt werden darf. Nimmt man die Texttemperatur fest 
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an (mangels besserer Hypothesen wird man zunächst T = 1 setzen), dann kann 
man k aus p, = hj = 0,034 ermitteln, und daraus näherungsweise 7. Da mit- 
hin das Verteilungsgesetz in den Urnen für alle Urnen (d.h. entsprechende Sach- 
verhalte) dasselbe ist, unterscheiden sich die Urneninhalte nur noch 


a) im Wortschatz (d.h. in der Menge verschiedener Wörter, nicht mehr in der 
Mächtigkeit dieser Menge!) 


b) in der Zuordnung der T Ränge zu den? Wörtern des jeweiligen Wortschatzes, 
wobei T! Permutationen möglich sind, 


Wir setzen nun auch noch den Wortschatz in allen Urnen als übereinstimmend 
voraus, (Die Transistortechnik und die Bienenzucht kommen also mit demsel- 
ben Wortschatz aus, nur daß das Wort "Wabe" in der Literatur über Transistor» 
technik einen etwa gleich extrem hohen Rang hat wie das Wort "Kollektor" in 
einer Spezialarbeit über Bienenzucht, ) 


Danngibtes?! a priori gleichwahrscheinliche Verteilungen % , d.h. eben die- 
se Zahl möglicher Urnen im mathematischen Modell, Die Wahrscheinlichkeit , 
daß ein noch völlig unbekannter Text aus der Urne mit der Verteilung 7 er- 
zeugt wurde, ist also 


1 
(1) pw) = Zi - 


Die Wahrscheinlichkeit, daß ein Text der Länge N, der aus dieser Urne erzeugt 
wurde, die empirische Verteilung $ = th, } aufweist, ist bekanntlich die 
polynomische Verteilung 


N! l o 
(2) pP, = — — Top “o. 


Damitergibt sich die Wahrscheinlichkeit dafür, daß ein noch unbekannter Text 


die empirische Verteilung Phat und ausder Urne mit der Verteilung Y hervor- 
ging, zu | 


(3) plev = PH pP, . 


A . . . . . 
Da es nur r! Verteilungen % gibt, ist hieraus ermittelbar 


(4) ey) =2., p($y), 
Y 
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womit ferner auch die Wahrscheinlichkeit berechenbar wird, mit welcher der 
empirischen Verteilung die Verteilung f in der Urne zugrundeliegt: 


p(9,Y) 

pP9) 
Das Wort, dasim empirischen Text den Rangr hat, hatte in jeder Verteilung Y 
einenvon Y abhängigen "theoretischen" Rang Eh (E. Y ) Damit ist schließ- 
lich der Erwartungswert von r 


(9) Put) = 


th GEP, 


. Ĉu, (ESI = e Pl (7) “Tu Ta I) 
v 


Dies ist die gesuchte Wortrangkorrektur, Da auf der rechten Seite nur Größen 
stehen, welche durch die Gleichungen (1) bis (5) in jeweils endlich vielen Schrit- 
ten aus der Statistik des empirischen Textes und aus der kanonischen Verteilung 
inden Urnen berechenbar sind, ist die Aufgabe theoretisch gelöst, Die explizite 
Durchführung dieser Methode scheidet natürlich auch bei Verwendung größter 
Rechenautomaten aus. 


Solange nicht abschätzbare (evtl, auch graphische) Näherungen für die Auswer- 
tung der Beziehung (6) gefunden werden, müssen wohl für eine praktisch disku= 
table Lösung des Wortrangkorrekturproblems Vernachlässigungen gemacht wer- 
den, die auch bei Anerkennung des angegebenen Modells noch theoretisch be- 
denklich sind, ohne allerdings so unplausibel sein zu müssen, wie bei der von 
Bergmann, Frank und Großer benutzten Korrektur, Es mögen hier zwei theore - 
tisch wohl weniger bedenkliche, aber noch nicht praktisch erprobte Alternativen 
angefügt werden, 


1, Man kann (wie bei Bergmann, Frank und Großer) statt mitr (r ) mit der Um=- 
kehrfunktion von T (r,) arbeiten (wobei natürlich jede dieser Funktionen noch 
vonN abhängt). Da die exakte Bestimmungauch dieser Funktion praktisch unüber- 
windliche Schwierigkeiten zu bereiten scheint, kann (für N als Parameter) der 
unserem Modell zugrundegelegte Zufallsprozeß auf einem Rechenautomaten si- 
muliert und daraus als statistische Kurve 76.) gewonnen werden, 


2. Mankannnach einem Autor suchen, der mehrfach denselben Sachverhalt mit 
abweichenden Formulierungenin verschiedenen Publikationen verschiedener Län- 
ge dargestellt hat, Die Häufigkeitsverteilung im Mischtext, der aus allen diesen 
Texten gebildet wird, setzt man dann der als gemeinsam angenommenen Wahr- 
scheinlichkeitsverteilung 7 gleich, Damit ist für jeden Einzeltext bezüglich 
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des Mischtextes eine eineindeutige Zuordnung zwischen den Ringen LA und r 
der im Einzeltext vorkommenden Wörter gegeben, Man versucht nun eine ge= 
wichtete Mittelwertbildung der Form 


+5 
rie) = 2 g (1. +1x1 ). ne +9 


mit irgendeiner Schranke S und einer für wachsendes | xl abnehmenden Gewichts - 
funktion g(r +1x1) vorzunehmen, so daß eine hinreichend geglättete Kurve 
durch die empirisch gefundene Punktmenge {r_ | r } gelegt werden kann. 
Macht man dies für alle verschieden langen Teiltexte, dann entsteht eine Kur- 
venschar mit dem Parameter N. Dieser Kurvenschar wird man künftig auch für 
andere Texte vergleichbarer Länge die Wortrangkorrektur entnehmen. 
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